期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于翻转梅尔频率倒谱系数的语音变调检测方法
林晓丹, 邱应强
计算机应用    2019, 39 (12): 3510-3514.   DOI: 10.11772/j.issn.1001-9081.2019050870
摘要285)      PDF (825KB)(236)    收藏
语音变调常用于掩盖说话人身份,各种变声软件的出现使得说话人身份伪装变得更加容易。针对现有变调语音检测方法无法判断语音是经过了何种变调操作(升调或降调)的问题,通过分析语音变调在信号频谱,尤其是高频区域留下的痕迹,提出了基于翻转梅尔倒谱系数(IMFCC)统计矩特征的电子变调语音检测方法。首先,提取各语音帧IMFCC及其一阶差分;然后,计算其统计均值;最后,在该统计特征上利用支持向量机(SVM)多分类器的设计来区分原始语音、升调语音和降调语音。在TIMIT和NIST语音集上的实验结果表明,所提方法无论对于原始语音、升调语音还是降调语音都具有良好的检测性能。与MFCC作为特征构造的基线系统相比,所设计的特征的方法明显提高了变调操作的识别率。在较少的训练资源的情况下,所提方法也获得了比基于卷积神经网络(CNN)的框架更好的性能;此外,在不同数据集和不同变调方法上也都取得了较好的泛化性能。
参考文献 | 相关文章 | 多维度评价
2. 用于版权和内容认证的音频水印
林晓丹
计算机应用    2010, 30 (8): 2269-2271.  
摘要328)      PDF (475KB)(1178)    收藏
提出了一种多功能水印算法,能同时对数字音频版权和内容完整性进行认证。首先将代表版权信息的二值图像以零水印方式嵌入音频美尔倒谱系数(MFCC),再将该系数转换成二进制串,作为最终的水印信息以量化方式嵌入音频离散余弦变换(DCT)域。检测时可实现两种水印信息的盲提取。实验结果表明,该方法不但对音频内容的恶意篡改非常敏感,而且能够定位出被篡改音频的位置;此外,还能有效抵抗诸如滤波、MP3压缩等常规信号处理操作,正确恢复版权信息。
相关文章 | 多维度评价